#清洗数据
import os
import codecs
from tkinter import font

import jieba
import mask as mask
import numpy as np
from PIL import Image
from matplotlib import pyplot as plt
from wordcloud import WordCloud, STOPWORDS
def PicSet():
    strs=""
    for txt in os.listdir('city\\武汉\\人才落户政策'):
        f=codecs.open('city\\武汉\\人才落户政策\\'+txt,'r')
        text=f.readlines()
        for str in text:
            strs=strs+str
    sep_list = jieba.lcut(strs,cut_all=False)
    sep_list=" ".join(sep_list)
    print(sep_list)
    mask=np.array(Image.open('img.png'))
    font=r'C:\Windows\Fonts\simhei.ttf'
    stopwords = ('的', '及', '人才','或','在', '武汉市', '户籍', '落户', '提供', '办理', '需', '人员', '条件','城区')  # 屏蔽的内容

    wc=WordCloud(
        font_path=font,
        margin=4,
        mask=mask,#背景图片
        background_color='white', #背景颜色
        max_font_size=30,
        max_words=200,
        stopwords=stopwords, #屏蔽的内容
    )
    wc.generate(sep_list) #制作词云
    wc.to_file('新增图片.jpg') #保存到当地文件
    plt.imshow(wc,interpolation='bilinear')
    plt.axis('off')
    plt.show()


def PicSub():
    strs = ""
    for txt in os.listdir('city\\武汉\\人才补贴政策'):
        f = codecs.open('city\\武汉\\人才补贴政策\\' + txt, 'r')
        text = f.readlines()
        for str in text:
            strs = strs + str
    sep_list = jieba.lcut(strs, cut_all=False)
    sep_list = " ".join(sep_list)
    print(sep_list)
    mask = np.array(Image.open('img.png'))
    font = r'C:\Windows\Fonts\simhei.ttf'
    stopwords = ('的', '及','政策', '在','武汉', '武汉市', '户籍', '落户', '提供', '办理', '需', '人员', '条件')  # 屏蔽的内容

    wc = WordCloud(
        font_path=font,
        margin=4,
        mask=mask,  # 背景图片
        background_color='white',  # 背景颜色
        max_font_size=30,
        max_words=200,
        stopwords=stopwords,  # 屏蔽的内容
    )
    wc.generate(sep_list)  # 制作词云
    wc.to_file('新增图片2.jpg')  # 保存到当地文件
    plt.imshow(wc, interpolation='bilinear')
    plt.axis('off')
    plt.show()